cuda并行编程

cuda

cuda全程 Compute Unified Device Architecture.

2009年nvidia引入tesla架构,创造了cuda。

cuda是专门为Nvidia GPU的提供的C/C++ API,是GPU计算资源的高层抽象(兼容不同架构、不同版本GPU)。

它的核心是三个关键的抽象——

  • 线程组的层次结构(hierarchy of thread groups):
  • 共享内存(shared memories):
  • 障碍同步(barrier synchronization):

它们只是作为最小的语言扩展集公开给程序员。

这些抽象提供细粒度数据并行性和线程并行性,嵌套在粗粒度数据并行性和任务并行性中。

扩展阅读